# PATENT ABSTRACTS OF JAPAN

(11)Publication number:

2002-024205

(43)Date of publication of application: 25.01.2002

(51)Int.CI.

G06F 17/16 G06F 9/38

(21)Application number : 2000-211607

(71)Applicant : NEC CORP

(22)Date of filing:

12.07.2000

(72)Inventor: KOYANAGI HISAO

(54) VECTOR SCATTER INSTRUCTION CONTROL CIRCUIT AND VECTOR TYPE INFORMATION PROCESSOR

# (57)Abstract:

PROBLEM TO BE SOLVED: To provide a device which actualizes performance improvement by evading the issue postponement of a following instruction due to cache invalidation processing by a vector scatter instruction and performing overtaking control over the vector scatter instruction.

SOLUTION: A vector type information processor is provided with a VSC address matching detection part 3 having registers stored with the area head address and area end address of a vector scatter instruction with area specification and a circuit which detects whether or not the address of the vector scatter instruction with the area specification and the address of a memory access instruction following the instruction overlap with each other, and an instruction issue control part 1 is equipped with a hold control circuit which receives an address matching signal from the VSC address matching detection part and holds the following memory access instruction whose address matches the address of the vector scatter instruction with the area specification.



#### (19)日本国特許庁 (JP)

# (12) 公開特許公報(A)

(11)特許出願公開番号 特開2002-24205 (P2002-24205A)

(43)公開日 平成14年1月25日(2002.1.25)

| (51) Int.Cl. <sup>7</sup> |       | 識別記号  | FI        |    | テー      | -7]-ド(参考) |
|---------------------------|-------|-------|-----------|----|---------|-----------|
| G06F                      | 17/16 |       | G06F 17/1 | 16 | Α       | 5 B O 1 3 |
|                           |       |       |           |    | F       | 5B056     |
|                           | 9/38  | 3 1 0 | 9/3       | 38 | 3 1 0 G |           |
|                           |       | 3 5 0 |           | ,  | 350A    |           |

審査請求 有 請求項の数9 OL (全 11 頁)

(21)出願番号

特願2000-211607(P2000-211607)

(22)出願日

平成12年7月12日(2000.7,12)

(71)出願人 000004237

日本電気株式会社

東京都港区芝五丁目7番1号

(72)発明者 小柳 尚夫

東京都港区芝五丁目7番1号 日本電気株

式会社内

(74)代理人 100080816

弁理士 加藤 朝道

Fターム(参考) 5B013 AA05 AA14 CC06

5B056 AA05 BB32 EE05 FF03 FF05

FF07 FF10

# (54) 【発明の名称】 ベクトルスキャタ命令制御回路及びベクトル型情報処理装置

#### (57)【要約】

【課題】ベクトルスキャタ命令でのキャッシュ無効化処理による後続命令の発行延期の回避と、ベクトルスキャタ命令の追い越し制御を可能とし、性能向上を実現する装置の提供。

【解決手段】領域指定付ベクトルスキャタ命令の領域先頭アドレスと、領域終了アドレスを格納するレジスタと、前記領域指定付ベクトルスキャタ命令のアドレスと、該命令の後続メモリアクセス命令とのアドレスとが重なっているか否か検出する回路と、を有するVSCアドレス一致検出部3と、命令発行制御部1は、VSCアドレス一致検出部からのアドレス一致信号を受けて、前記領域指定付ベクトルスキャタ命令のアドレスと一致した後続メモリアクセス命令をホールドさせるホールド制御回路を備える。



#### 【特許請求の範囲】

【請求項1】命令セットとして、スキャタ領域が指定さ れる領域指定付ベクトルスキャタ命令を設け、

前記領域指定付ベクトルスキャタ命令がアクセスするア ドレスと、前記ベクトルスキャタ命令の後続のメモリア クセス命令のアドレスとが重なっているか否かを検出す る手段と、

アドレスが重なっている場合には、前記後続のメモリア クセス命令をホールドさせる手段と、

路。

【請求項2】キャッシュ無効化が終了するまで、前記後 続のメモリアクセス命令がホールドされる、ことを特徴 とする、請求項1記載のベクトルスキャタ命令制御回

【請求項3】ベクトル型情報処理装置において、

領域開始アドレスと領域終了アドレスが指定される領域 指定付ベクトルスキャタ命令の領域開始アドレスと、領 域終了アドレスを格納するレジスタと、

前記領域指定付ベクトルスキャタ命令の後続のメモリア クセス命令がアクセスするアドレスが、前記領域指定付 ベクトルスキャタ命令の前記領域開始アドレスと前記領 域終了アドレスで規定されるスキャタ領域内にあるか否 かを判定し、前記後続のメモリアクセス命令のアドレス が前記スキャタ領域内にある場合に、アドレス一致信号 を出力する回路と、を有するベクトルスキャタ(VS C)アドレス一致検出部を備え、

命令発行制御部において、前記ベクトルスキャタアドレ ス一致検出部からのアドレス一致信号を受けて、前記後 続メモリアクセス命令をホールドさせるホールド制御回 30 路を備えたことを特徴とするベクトル型情報処理装置。

【請求項4】命令データを解読して、命令動作を指示す る命令発行制御部と、

前記命令発行制御部からのアドレスを受け取り、キャッ シュの制御を行うキャッシュ制御部と、

前記命令発行制御部からベクトル命令が発行された場 合、実行指示を受け取り、前記ベクトル命令が、スキャ 夕領域の領域開始アドレスと領域終了アドレスが指定さ れる領域指定付ベクトルスキャタ命令である場合、メモ リに対して、書き込むべきベクトルデータを送出すると ともに、更に、キャッシュ無効化アドレスを送出するべ クトルユニットと、

前記ベクトルユニットからキャッシュ無効化アドレスを 受け取り前記キャッシュの無効化を行うキャッシュ無効 化制御部と、

前記命令発行制御部から、前記領域指定付ベクトルスキ ャタ命令が発行された場合、前記命令発行制御部からア クセスされるレジスタブロックより、前記領域指定付べ クトルスキャタ命令のスキャタ領域の領域開始アドレス と、領域終了アドレスとを受け取り、前記領域指定付べ クトルスキャタ命令の後続のメモリアクセス命令とアク セスするアドレス領域が重なっているか否かを検出し、 アドレスが重なっている場合に、アドレス一致信号をア クティブ状態として、前記命令発行制御部に対して送出 するベクトルスキャタ(VSC)アドレス一致検出部 と、

を備え、

前記命令発行制御部が、前記ベクトルスキャタアドレス 一致検出部から送出されたアクティブ状態の前記アドレ を備えたことを特徴とするベクトルスキャタ命令制御回 10 スー致信号を受けて、前記後続のメモリアクセス命令を ホールドさせるように制御するホールド制御回路を備え たことを特徴とする、ベクトル型情報処理装置。

> 【請求項5】前記ホールド制御回路は、前記ベクトルス キャタアドレス一致検出部からの前記アドレス一致信号 がインアクティブのときには、前記後続のメモリアクセ ス命令をホールドさせない、ことを特徴とする、請求項 4 記載のベクトル型情報処理装置。

【請求項6】前記ホールド制御回路は、前記キャッシュ 無効化制御部よりキャッシュ無効化の終了の通知を受け 20 るまで、前記後続のメモリアクセス命令をホールドさせ る、ことを特徴とする、請求項4又は5記載のベクトル 型情報処理装置。

【請求項7】前記ペクトルスキャタアドレス一致検出部 が、前記後続のメモリアクセス命令のアクセスアドレス と、前記領域指定付ベクトルスキャタ命令の領域開始ア ドレスとを比較し、前記後続のメモリアクセス命令のア クセスアドレスが前記領域開始アドレス以上であるとき アクティブ状態の信号を出力する第1の比較器と、

前記後続のメモリアクセス命令のアクセスアドレスと前 記領域指定付VSC命令の領域終了アドレスとを比較 し、前記後続のメモリアクセス命令のアクセスアドレス が前記領域終了アドレス以下であるときアクティブ状態 の信号を出力する第2の比較器と、

前記第1の比較器と前記第2の比較器の出力がともにア クティブ状態のとき、前記アドレス一致信号をアクティ ブ状態として出力する論理回路と、

を備えたことを特徴とする、請求項4乃至6のいずれか ーに記載のベクトル型情報処理装置。

【請求項8】前記領域指定付ベクトルスキャタ命令が、 命令コードとして、オペランドの所定のフィールドで、 前記レジスタブロックの2本のレジスタを指定し、それ ぞれに、スキャタ領域の領域開始アドレスと領域終了ア ドレスを指定する、構成とされている、ことを特徴とす る、請求項4乃至7のいずれか一に記載のベクトル型情 報処理装置.

【請求項9】前記ホールド制御部は、前記ベクトルスキ ャタアドレス一致検出部から送出されたアクティブ状態 の前記アドレス一致信号を受けて、前記後続のメモリア クセス命令に、さらに後続する命令が存在する場合に 50 は、これらの命令も前記命令発行制御部内の各ステージ

2

にホールドさせる、ことを特徴とする、請求項4乃至7 のいずれかーに記載のベクトル型情報処理装置。

#### 【発明の詳細な説明】

#### [0001]

【発明の属する技術分野】本発明は、ベクトル型情報処理装置に関し、特に、ベクトルスキャタ命令制御回路に関する。

#### [0002]

【従来の技術】ベクトル型情報処理装置において、通常、ベクトル命令でアクセスされるメモリ領域は、キャッシュに登録されない。

【0003】その理由は、ベクトル命令が対象とするデータは、一般に参照の局所性が乏しく、キャッシュに登録しても、直ちに他のキャッシュラインデータによって、スワップアウトされ、キャッシュのヒット率が低下する、ためである。

【0004】また、ベクトル型情報処理装置において、ベクトルのメモリアクセス命令には、VST(ベクトルストア)/VLD(ベクトルロード)命令のように、開始アドレスとアクセスするベクトルデータの間隔(ディスタンス)によって、規定するものがある。

【0005】このうち、VLD命令は、この規定されたアドレスに従って、ベクトルユニット内に存在する「ベクトルレジスタ」と呼ばれる複数ワードからなるベクトルデータ格納領域に、メモリのデータを取り込む。

【0006】逆に、VST命令は、ベクトルレジスタの データを、メモリに書き込む。

【0007】このVST命令は、命令発行時点で、アクセスするアドレスを認識することが可能であるため、VST命令を、VLD命令やスカラロード命令が追い越し制御することによって、性能向上を図ることが比較的容易である。

【0008】一方、VGT (ベクトルギャザ) / VSC (ベクトルスキャタ) 命令のような、いわゆる「リストベクトル」と呼ばれる命令では、ベクトルユニット内に存在するベクトルレジスタの値を、メモリのアクセスアドレスとしているため、ベクトルユニットに、命令が到達した時点で、初めてアクセスするアドレスが判り、且つ、そのアドレスは、一般に、ランダムである。

【0009】本発明の理解のために、リストベクトル命令について、図8を参照して、説明しておく。

【0010】まず、図8(a)に示すように、VGT命令(ベクトルギャザ命令)は、ベクトルレジスタVyの各要素に格納されているアドレスVA(n)のメモリデータを、ベクトルレジスタVxの対応する要素に格納するように、メモリからデータをロードするものである。

【0011】また図8(b)に示すように、VSC命令 (ベクトルスキャタ命令)は、ベクトルレジスタVyの 各要素に格納されているアドレスVA(n)のメモリ領 域へ、ベクトルレジスタVxの対応する要素データを格 50

納するように、メモリにデータをストアするものであ る。

【0012】ベクトルメモリアクセス命令とは対照的に、スカラメモリアクセス命令の場合、一般的に、データ参照の局所性があることから、通常、キャッシュメモリにデータを格納し、メモリアクセスのレイテンシを隠す方式が採用されている。

## [0013]

【発明が解決しようとする課題】このようなキャッシュ 10 を用いたベクトル型情報処理装置において、ベクトルメ モリアクセス命令が発行され、メモリへの書き込みが発 生した場合、キャッシュの一致性を維持するために、ア クセスするアドレスがキャッシュ内に登録されている場 合には、キャッシュ無効化を行う必要がある。これによ って、後続キャッシュアクセス命令がストールし、性能 低下の主要因になっている。

【0014】そして、キャッシュ無効化処理は、VST (ベクトルストア) 命令とVSC (ベクトルスキャタ) 命令では異なる。

【0015】VST命令の場合、命令発行時に、開始アドレスとディスタンスが決定されるので、これら2つのデータによって、比較的、高速に、キャッシュ無効化ができると共に、アクセスする開始アドレスと、終了アドレスを即座に計算できることから、後続のスカラLD(ロード)命令とのアドレスが一致しない場合に、後続命令に、追い越し制御させることができる。

【0016】一方、VSC(ベクトルスキャタ)命令の場合には、アクセスするアドレスが、ベクトルレジスタを読み出した後でなければ分からないこと、及び、アドジンスがランダムであることから、ベクトルユニットから、スカラユニット内のキャッシュ無効化制御部(図1の4参照)に、無効化アドレスが送られ、該無効化アドレスに合致するキャッシュデータを無効化する処理を行う必要がある。

【0017】このため、VSC命令に後続する全てのメモリアクセス命令は、このキャッシュ無効化処理が終了しないと、命令を発行することができず、性能低下が発生する。

【0018】この問題について、図6及び図7を参照し 40 て具体的に説明する。

【0019】まず、説明を容易にするため、スカラロード(キャッシュアクセス)命令であるLDS命令について、図7を参照して説明する。このLDS命令は、VGT/VSC命令と同様、OPC(オペコード)と、オペランドX、Y、Zの計4つのフィールドから構成され、アドレスは、<math>Ry+Rzで計算され、アドレスRy+Rzのメモリから読み出した結果M(Ry+Rz)は、レジスタRxに格納される。

【0020】さて、図6(a)において、まずVST (ベクトル)命令の発行後、キャッシュ無効化が行わ

4

れ、それとほぼ同時に、ベクトルからのメモリへの書込 みが行なわれる。

【0021】その後続のLDS命令は、VST命令のアドレスとそのアドレスが重ならなければ、たとえ、キャッシュが無効化されていても、命令を発行することができる。

【0022】一方、図6(b)を参照すると、VSC(ベクトルスキャタ)命令の場合、キャッシュ無効化処理が行なわれるのは、ベクトルの処理が始まり、無効化アドレスが送られてくる時であり、また、VSC命令の発行直後にアクセスするアドレスは不明であり、しかも、ランダムであることから、キャッシュ無効化が終了するまで、後続のLDS命令がホールドで待たされる。【0023】このように、VSC命令に後続する全てのメモリアクセス命令は、このキャッシュ無効化処理が終

【0024】したがって、本発明は、上記問題点に鑑みてなされたものであって、その目的は、ベクトル処理装置において、ベクトルスキャタ命令でのキャッシュ無効化処理による後続命令の発行延期の回避と、ベクトルスキャタ命令の追い越し制御を可能とし、性能向上を実現する装置を提供することにある。

了しないと、命令を発行することができず、性能低下が

#### [0025]

発生する。

【課題を解決するための手段】前記目的を達成する本発明は、アクセスするメモリのアドレスの範囲が指定される領域指定付ベクトルスキャタ命令のアクセスするアドレスが、後続のメモリアクセス命令のアドレスと重なっているか否かを検出する手段と、アドレスが一致した後続のメモリアクセス命令をホールドさせる手段とを備えている。

#### [0026]

【発明の実施の形態】本発明の実施の形態について説明する。本発明は、領域指定付ベクトルスキャタ命令の領域開始アドレスと、領域終了アドレスを格納するレジスタと、前記領域指定付ベクトルスキャタ命令のアドレスと、該命令の後続メモリアクセス命令とのアドレスとが重なっているか否か検出する回路と、を備えたベクトルスキャタ(VSC)アドレス一致検出部を備え、命令発行制御部は、前記領域指定付ベクトルスキャタ命令のアドレスと一致した後続メモリアクセス命令をホールドさせるホールド制御回路を備えている。

【0027】より詳細には、本発明は、その好ましい一 実施の形態において、命令データを解読して、命令動作 を指示する命令発行制御部(1)と、命令発行制御部

(1) からのアドレスを受け取り、スカラ型メモリアクセス命令に対して、キャッシュの更新等、キャッシュの制御を行うキャッシュ制御部(2)と、命令発行制御部(1)からベクトル命令が発行された場合、実行指示を受け取り、前記ベクトル命令が、スキャタ領域の開始ア

6

ドレスと終了アドレスが指定される領域指定付VSC命 令 (ベクトルスキャタ命令) である場合、メモリ(7) に対して、書き込むべきベクトルデータを送出するとと もに、更に、キャッシュ無効化アドレスを送出するベク トルユニット(6)と、ベクトルユニット(6)からキ ャッシュ無効化アドレスを受け取り前記キャッシュの無 効化を行うキャッシュ無効化制御部(4)と、命令発行 制御部 (1) から、領域指定付VSC命令が発行された 場合、レジスタブロック (5) より、前記領域指定付 V 10 SC命令のスキャタ領域の開始アドレスと終了アドレス を受け取り、前記領域指定付VSC命令の後続のメモリ アクセス命令とアクセスするアドレス領域が重なってい るか否かを検出し、重なっている場合、アドレス一致信 号をアクティブ状態として、命令発行制御部 (1) に対 して送出するVSCアドレス一致検出部(3)と、を備 え、命令発行制御部(1)は、VSCアドレス一致検出 部(3)から送出されたアクティブ状態の前記アドレス 一致信号を受けて、後続のメモリアクセス命令を、ホー ルドさせるホールド制御回路(図2の105)を備えて 20 いる。

【0028】本発明において、前記領域指定付VSC命令は、オペコードと、X、Y、Zフィールドを有し、Zフィールドで、前記レジスタブロックの2本のレジスタを指定し、それぞれに、スキャタ領域の開始アドレスと、終了アドレスを指定する。

#### [0029]

【実施例】上記した本発明の実施の形態についてさらに 詳細に説明すべく、本発明の実施例について図面を参照 して以下に説明する。図1は、本発明の一実施例の基本 30 構成を示す図である。

【0030】図1を参照すると、本発明の一実施例をなすベクトル処理装置において、命令発行制御部1と、レジスタブロック5と、キャッシュ制御部2と、VSCアドレス一致検出部3と、キャッシュ無効化制御部4がスカラプロセッサを構成しており、ベクトルユニット6と、メモリ7を備えている。

【0031】このうち命令発行制御部1は、信号線71 を経由して、メモリ7から読み出した命令データを解読 して、命令動作を指示する。

【0032】命令発行制御部1は、キャッシュ制御部2と、VSC(ベクトルスキャタ命令)アドレス一致検出部3に対しては、信号線12を介して、アドレスを送出し、キャッシュアクセスと、VSCアドレス一致を行う。

【0033】命令発行制御部1は、レジスタブロック5に対して、信号線15、51を介して読み出し/書込みを制御する。

【0034】キャッシュ制御部2は、命令発行制御部1 からのスカラロードがミス(ミスヒット)した場合、信 50 号線27を介して、キャッシュリフィルデータを要求 し、メモリ7からのデータを信号線72を介して受け取る。

【0035】また、キャッシュ制御部2は、スカラストア命令が発行された場合に、キャッシュにヒットした場合には、キャッシュデータを書き換え、更に、メモリ7に対しても、必ず書き換えるストアスルーアルゴリズムに基づく。

【0036】命令発行制御部1において、ベクトル命令が発行された場合、信号線16を介して、実行指示が、ベクトルユニット6に送られる。その際、ベクトル命令がVSC命令(ベクトルスキャタ命令)である場合、ベクトルユニット6は、メモリ7に対して書き込むべきベクトルデータを信号線67を介して送出し、更に、ベクトルユニット6は、信号線64を介して、キャッシュ無効化アドレスを、キャッシュ無効化制御部4に送出する。

【0037】また、VSC命令が発行された場合、レジスタブロック5から信号線53を介して、VSC命令の開始アドレスと、終了アドレスが、VSCアドレス一致検出部3に送られ、VSCアドレス一致検出部3では、後続のメモリアクセス命令とアクセスするアドレス領域が重なっているか判定し、重なっている場合、VSCアドレス一致検出部3から、信号線31を介して、アドレス一致信号が、命令発行制御部1に送られる。

【0038】次に、本発明で、新たに提案されている、 領域指定付VSC命令の仕様について、図3を参照して 説明する。

【0039】図3に示すように、命令フィールドは、前述のように、OPC (オペコード)と、X、Y、Zの4つのフィールドに分けられる。通常のVSC命令と異なるところは、Zフィールドにおいて、レジスタブロック5内にある、RnとRn+1の2本のレジスタを指定し、それぞれに、スキャタ領域の開始アドレスと、終了アドレスを指定することである。なお、VSC命令では、X、Yフィールドは、ベクトルユニット6のベクトルレジスタの番号を指定するための用いられる。

【0040】図2は、本発明の一実施例における命令発行制御部1と、レジスタブロック5と、VSCアドレスー致制御部3の構成を説明するための図である。

【0041】図2を参照すると、メモリから信号線71を介して供給される命令データは、一旦、命令キャッシュ101に格納され、Dステージレジスタ102のOPC(命令コード)、X、Y、Zの4つのフィールドに格納する。

【0042】その後、EEステージレジスタ103に、命令コードと、Xフィールドと、Yフィールドが移動し、それと同時に、レジスタブロック5のレジスタ50から、EEステージのレジスタYdata eeと Zdata eeに、オペランドデータを読み出す。

【0043】LDS命令の場合には、次のECステージ 50 テージで待たせる。

2

レジスタ104に、EEステージレジスタ103の情報を移行すると同時に、AAD(アドレス加算器)115で計算したアドレスを、アドレスec(レジスタ)に格納し、キャッシュアクセスに使用する。アドレスec(レジスタ)の出力は、図1のアドレス12として、キャシュ制御部2として出力され、またVSCアドレスー致検出部3に供給される。

【0044】また、本発明によって新たに設けられた領域指定VSC命令の場合は、EEステージのZdata ee (ラッチ)を介して読み出された、VSC開始アドレスと終了アドレスを、それぞれ、ECステージのVSC開始アドレスecと、VSC終了アドレスecに格納する。なお、図2のHLD(ホールド)制御部105からVSC開始アドレスecと、VSC終了アドレスecに供給される信号Hは、データをホールドする信号である。

【0045】その後、HLD制御部105からのVSC 発行信号13によってストローブされ、VSC開始アド レスecと、VSC終了アドレスecの保持データは、 20 EBステージのVSC開始アドレスeb(ラッチ)と、 VSC終了アドレスeb(ラッチ)にセットされる。 【0046】これらの情報は、次の領域指定付VSC命

令発行まで、保持される。

【0048】そして、領域指定付VSC命令の発行直後の後続LDS命令からアクセスするアドレスが、VSC命令のスキャタ領域と重なった場合に、VSCアドレス一致信号31がアクティブとなり、HLD制御部105は、ECHLD信号をアクティブとし(オンし)、この信号は、キャッシュ無効化制御部4から出力されるキャッシュ無効化終了信号41がオンする(キャッシュ無効化処理が終了する)まで、オン状態とされ、後続のLDS命令は、命令発行制御部1のECステージにホールドされる。

【0049】ECステージで待っているLDS命令に も、後続命令が存在する場合には、HLD制御部105 は、EEHLD信号、もしくはDHLD信号をオンさせ て、これらの後続命令を、EEステージ、もしくはDス

【0050】なお、図2において、REG更新制御部111は、レジスタブロック5のレジスタ50を更新制御するものであり、例えば公知のWAWハザードの回避制御を行う。また、VSC命令の場合、ECステージレジスタ104のX/Yecからの出力は、ベクトルレジスタの番号であり信号線16から、ベクトルユニット6に供給される。

【0051】次に、本発明の一実施例における、領域指定付VSC命令と、その直後に存在するLDS命令の動作タイミングについて、図4、及び図5を参照して説明する。これら2つの例では、後続のLDS命令がキャッシュヒットした場合を想定している。

【0052】図4には、領域指定付VSC命令で指定された領域(スキャタ領域)と、後続のLDSがアクセスするアドレスが重ならなかった場合、すなわち、アドレス一致しない場合のタイミング動作が示されている。なお、図4、図5において、D、EE、EC、EBは、図2に示した命令発行制御部1内のDステージ、EEステージ、ECステージ、EBステージ(VSC開始アドレスeb、VSC終了アドレスeb)の各ステージに対応している。

【0053】領域指定付VSC命令は、Zオペランド (Zd) に指定される、レジスタRn、Rn+1と2回 読む必要があるため、Dステージで、2つに分解される (図4のVSC1st、VSC2nd)。 なお図2のインクリメンタ (+1) は、レジスタRn、Rn+1と二回読むための制御回路である。

【0054】タイミング3、4で、VSC命令発行13が出力され、その時に、各々、VSC開始アドレスeb と、VSC終了アドレスebに格納される。

【0055】その後、LDS命令がタイミング5で、ECステージから発行されると、タイミング6で、キャッシュデータを読みこみ、タイミング7には、レジスタブロック5のWDR(write data rejister)にキャッシュデータを格納し、タイミング8で、WDRからレジスタ50に書き込んで、LDS命令の実行を終了する。なお、レジスタブロック5のWARは(write address rejister)であり、レジスタ50(レジスタファイル)の中の複数のレジスタの一つを選択する。

【0056】次に、VSC命令で指定された領域と、後続のLDSがアクセスするアドレスが重なった場合、すなわち、アドレス一致した場合の動作について、図5を参照して説明する。図4に示したアドレス不一致の場合との違いは、タイミング5で、VSCアドレス不一致がオンしたところから始まる。

【0057】その後、LDS命令は、タイミング7で、 キャッシュ無効化終了信号41がオンするまで、ECス テージで、ECHLD信号をオンさせて、ホールドされる。

【0058】その後、アドレス不一致の場合と同様にし

て、LDS命令の結果を、レジスタブロック5のWDR を介して、レジスタ50に、データを書き込む。

【0059】本発明の一実施例においては、命令制御回路において、領域指定VSC命令によって、アクセスするメモリ領域に関する示唆を、プログラマ(すなわちプログラマがコーディングしたプログラム)より得ることで、後続のLDS命令の追い越し制御が可能となり、大幅な性能向上が実現できる。本発明の一実施例の効果を、図6を参照して、より詳しく説明する。

【0060】まず、VST命令の場合、発行時点でアクセスする領域が判るため、直ちに、キャッシュ無効化が実現でき、後続のLDS命令の追い越し制御が可能となる。もし、追い越しが可能であると判定された場合には、キャッシュ無効化中でも、LDS命令の実行は可能となる。

【0061】一方、従来技術におけるVSC命令の場合、命令発行時点ではメモリアクセス領域が判らず、またランダムでもあるため、後続のLDS命令の追い越し制御は不可能であり、キャッシュ無効化処理終了まで待20 たなくてはならない。

【0062】本発明によれば、VSC命令であっても、 VST命令のように、後続LDS命令の追い越し制御を 可能としている。

【0063】そして、従来技術においては、後続LDS 命令の待ちが、任意のアドレスについてVSC発行直後 からキャッシュ無効化終了まで必要となる。

【0064】これに対して、本発明によれば、この待ち時間は、アドレス一致しない場合にはなくなる。このため、きわめて高い頻度で出現するLDS命令の性能向上 30 に特段に寄与する。

# [0065]

【発明の効果】以上説明したように、本発明によれば、 領域指定VSC命令によって、アクセスするメモリ領域 に関する示唆を、プログラムから得ることで、後続のL DS命令の追い越し制御を可能としており、処理性能を 特段に向上することができる、という効果を奏する。そ の理由は、本発明においては、命令中でスキャタ領域が 指定されるベクトルスキャタ命令がアクセスするアドレ スと、後続のメモリアクセス命令のアドレスとが重なっ ているか否かを検出する手段と、アドレスが重なってい る場合には、前記後続のメモリアクセス命令をホールド させる手段とを備えたためである。

# 【図面の簡単な説明】

【図1】本発明の一実施例の構成を示す図である。

【図2】本発明の一実施例における命令実行制御部とV SCアドレス一致検出部の構成を示す図である。

【図3】本発明の一実施例におけるVSC命令を説明するための図である。

【図4】本発明の一実施例の動作を説明するための図で 50 ある。

【図5】本発明の一実施例の動作を説明するための図である。

【図6】 VSC命令と後続LDS命令の処理を説明するための図である。

【図7】 LDS命令の処理を説明するための図である。

【図8】従来のVGT、VSC命令を説明するための図である。

## 【符号の説明】

- 1 命令発行制御部
- 2 キャッシュ制御部
- 3 VSCアドレス一致検出部
- 4 キャッシュ無効化制御部
- 5 レジスタブロック
- 6 ベクトルユニット
- 7 メモリ
- 12 アドレス信号
- 13 VSC発行信号
- 15、51 信号線

- 16 ベクトル命令発行指示
- 25 制御信号
- 27 アドレス
- 31 アドレス一致信号
- 41 キャッシュ無効化終了信号
- 50 レジスタ
- 64 無効化アドレス
- 67 アドレス信号
- 71 命令データ
- 10 72 データ
  - 101 命令キャッシュ
  - 102 Dステージレジスタ
  - 103 EEステージレジスタ
  - 104 ECステージレジスタ
  - 105 HLD制御部
  - 301、302 比較器
  - 303 論理積回路

【図1】



【図7】



[図2]



【図3】



【図4】



【図5】



【図6】



(a) (b)



J